بازشناسی برون خطی کلمات دست نویس فارسی مبتنی بر ویژگی های آماری و ساختاری با استفاده از طبقه بند های knn وmlp و اجرای الگوریتم fcnn

پایان نامه

دانشگاه آزاد اسلامی - دانشگاه آزاد اسلامی واحد تهران مرکزی - دانشکده مهندسی برق و الکترونیک
نویسنده زهرا مددی
استاد راهنما فرداد فرخی کاوه کنگرلو
تعداد صفحات: ۱۵ صفحه ی اول
سال انتشار 1391

چکیده

هدف این پژوهش ارائه روشی نوین با بازدهی مطلوب، مبتنی بر به کارگیری الگوریتم های موثر برای بازشناسی برون خط و مستقل از تفکیک کلمات دست نویس فارسی است. بدین منظور سه راهکار متمایز متشکل از مراحل دریافت تصاویر ورودی، پیش پردازش، استخراج ویژگی و طبقه بندی پیشنهاد شده است. عملیات آستانه گیری، حذف نویز، استخراج اسکلت به منظور حذف اثر عرض قلم، محدود سازی کلمات یا زیرکلمات در پنجره های محدود کننده و تغییر اندازه مجدد تصاویر به منظور کاهش اثر ناهمگونی ابعاد نگارش، حذف تغییرات چرخشی، بازکردن و بستن متوالی مبتنی بر عناصر مورفولوژی برای حذف ناپیوستگی و حفره های ناخواسته، از جمله عملیات پیش پردازشی است که پس از اسکن و دریافت قالب های دیجیتال تصاویر کلمات دست نویس، به منظور کاهش اثر تغییرات نگارشی ناخواسته و نامطلوب در عملیات بازشناسی بر روی تمامی تصاویر اعمال گردیده و اجرای صحیح این مرحله از سیستم بازشناسی در بهبود نتایج مراحل بعدی تأثیر چشم گیری را ارائه داده است. اولین راهکار پیشنهاد شده در این پژوهش، مبتنی بر مدلسازی گاوسین تصاویر کلمات نمونه و طبقه بندی آنها با بهره گیری از عملیات تطبیق الگو است. در این شیوه به منظور بازشناسی 10 کلاس از کلمات دست نویس فارسی، ابتدا مدل های گاوسین 240 تصویر (24 نمونه از هر کلاس) بعنوان نمونه های آموزش در نظر گرفته می شود. سپس برای بازشناسی 80 نمونه باقیمانده از اندازه گیری فواصل اقلیدسی مدل های گاوسین هر نمونه آزمون تا 240 نمونه آموزش استفاده می گردد. نهایتاً با شناسایی سه نمونه آموزش نزدیکتر به هر نمونه آزمون، و اجتماع گیری از میزان بازشناسی صحیح در این سه سطح تشابه نزدیکتر، نرخ 80.25% حاصل گردیده است. همانطور که از نتیجه این بازشناسی مشخص است، شیوه استخراج ویژگی بر مبنای مدلسازی گاوسین برای توصیف کلمات دست نویس چندان مناسب به نظر نمی رسد، علت اصلی این امر تأثیر منفی دو عامل، یکسان نبودن ابعاد نگارشی اجزا مختلف تشکیل دهنده بدنه کلمات دست نویس (بدنه زیرکلمات، حروف و نقاط) و همچنین تغییرات نگارشی ناخواسته در شیوه های نگارشی افراد مختلف (زوایای نقاط تقاطع و شیب بدنه)، در تولید مدل های مخلوطی گاوسین مشابه برای کلمات نظیر هر کلاس است.به عبارتی نتیجه بازشناسی این شیوه فقدان توانایی لازم آن را برای تولید مدل های موثر در بازشناسی کلمات دست نویس به روش تطبیق الگو نشان داده است. در حقیقت اجرای الگوریتم بازشناسی بر مبنای مدلسازی و عملیات تطبیق الگو بیشتر برای کاراکترهای گسسته ( حروف و اعداد) مناسب بوده و استفاده آن برای کلمات پیوسته چندان نتایج مطلوبی را ارائه نمی دهد. دومین راهکار ارائه شده در این پایان نامه، مبتنی بر استخراج بردارهای ویژگی ترکیبی و طبقه بندی با استفاده از طبقه بندهای knn و mlp است. در این شیوه پس از اسکن و ارائه قالب دیجیتالی تصاویر کلمات دست نویس به رایانه، ابتدا به منظور حذف همپوشی های عمودی احتمالی زیرکلمات، عملیات برچسب گذاری و تفکیک آنها در ماتریس های تصویری مجزا اجرا شده، سپس کلیه مراحل پیش پردازشی که قبلاً اشاره گردید بر روی تمامی تصاویر زیرکلمات اعمال می شود. در مرحله استخراج ویژگی، به منظور فراهم نمودن بردارهای ویژگی توانمندی که بتوانند به خوبی از عهده توصیف دقیق مشخصات ظاهری و ساختاری کلمات دست نویس برآیند از ترکیب شیوه های آماری، ساختاری و اعمال تبدیل موجک استفاده شده است. بطوریکه ابتدا پارامترهای آماری میانگین، واریانس و انرژی مرتبط با نمودارهای هیستوگرام افکنش عمودی تصاویر زیرکلمات محاسبه شده، سپس با بکارگیری الگوریتم تجزیه تحلیل تطابقی ca، مقادیر ویژه سازنده ماتریس های تصویری زیرکلمات نیز بعنوان پارامترهای ساختاری بردارهای ویژگی استخراج می گردند. پس از آن با اعمال تبدیل موجک یک بعدی گسسته مبتنی بر موجک پایه ی هار بر توابع هیستوگرام افکنش عمودی تصاویر زیرکلمات، ضرایب موجک نماینده جزئیات فرکانس بالا و کلیات فرکانس پایین هر تصویر نیز فراهم گردیده و نهایتاً این سه دسته ویژگی حاصل از محاسبات آماری، ساختاری و تبدیل موجک برای هر تصویر نمونه در یک بردار ویژگی ترکیب می شوند تا بتوانند توصیفگرهای مناسبی را ارائه دهند. در مرحله بعد، پیش از اجرای عملیات طبقه بندی، از الگوریتمfcnn برای انتخاب مثال های موثر در آموزش استفاده می شود تا بدین ترتیب عملیات طبقه بندی بتواند با بازده مندی بیشتر و به طور دقیق تر اجرا گردد. نهایتاً ماتریس حاصل از اجرای الگوریتمfcnn به عنوان ماتریس آموزش و مابقی داده ها به عنوان ماتریس آزمون، در مراحلی جداگانه برای بازشناسی به طبقه بندهای mlp و knn ارسال می شوند. پس از آن، یک مرحله اعمال الگوریتم بهینه سازی uta برای حذف ویژگی های غیر موثر و مخرب به منظور کاهش ابعاد بردارهای ویژگی، افزایش بازدهی شبکه، بهبود دقت و سرعت بازشناسی اجرا می گردد. بعنوان مزیت این شیوه پیشنهادی، می توان به ساده بودن مرحله استخراج ویژگی، و اینکه فراهم سازی بردارهای ویژگی ترکیبی (ویژگی های آماری، ساختاری و ضرایب موجک) می تواند نقش به سزایی را در افزایش دقت طبقه بندی ایفا کند، اشاره نمود. همچنین افزایش دقت بازشناسی با اعمال الگوریتم fcnn در مرحله طبقه بندی به منظور بهره گیری از مشابهت ما بین نمونه های هم کلاس در روند تشکیل ماتریس موثر آموزش، و دستیابی به ابعاد بهینه و سرعت مطلوب سیستم بازشناسی با اجرای الگوریتم uta، از دیگر مزایای این شیوه هستند. اعتبار اجرای روش پیشنهادی بر روی بخشی از پایگاه داده ایرانشهر(متشکل از 640 تصویر کلمه دست نویس)، با دقت طبقه بندی 97.9% به اثبات رسیده است. در سومین راهکار پیشنهاد شده در این تحقیق، از تبدیل موجک دو بعدی گسسته بر مبنای تشکیل بانکی از موجک های پایه، الگوریتم تجزیه تحلیل تطابقی ca و اعمال طبقه بندmlp برای بازشناسی استفاده شده است. در این شیوه نیز، پس از اسکن و ارائه قالب دیجیتالی تصاویر کلمات دست نویس به رایانه، کلیه مراحل پیش پردازشی که قبلاً اشاره گردید بر روی تمامی تصاویر کلمات اجرا می شود. سپس در مرحله استخراج ویژگی، به منظور استخراج ویژگی های موثر برای بازشناسی کلمات دست نویس فارسی، در ابتدا قصد داشتیم برای هر کدام از کلاس های بازشناسی، یک موجک پایه را متناظر با شکل ساختاری آنها تعریف نماییم. اما از آنجایی که تعریف موجک های پایه نظیر تمام کلاس ها، به گونهای که اعمال تبدیل موجک بر مبنای آنها بتواند ویژگی های مشابه ای را برای نمونه های هر کلاس و ویژگی های متمایزی را برای نمونه های نظیر کلاس های مختلف تولید نماید، در صورت گسترده بودن تعداد کلاس ها امری غیر ممکن است، از شیوه تشکیل بانکی از موجک های پایه استفاده کردیم. بدین ترتیب توانستیم با به کارگیری هر یک از اعضا این بانک در هر بار اعمال تبدیل موجک، شباهت مابین کلمات هم کلاس و تفاوت مابین کلمات غیر هم کلاس را به نحوی جدید به نمایش در آوریم. همانطور که می دانیم، ساختار نگارشی کلمات در زبان فارسی از شکلی غیر تقارنی و نوسانات ارتفاعی زیادی برخوردار است، و خانواده موجک های پایه دابیچز به دلیل داشتن ساختاری غیر متقارن و تغییر ارتفاع نوسانات در شکل موج مربوطه شان، دارای شباهت ساختاری زیادی با نحوه نگارشی کلمات در زبان فارسی هستند. از این رو برای تولید ویژگی های توصیفی موثر، بانکی از موجک های پایه این خانواده تشکیل شده است. هر چند، به منظور تأیید صحت موثر بودن کارایی بانک موجک پایه خانواده دابیچز، ابتدا بانکی از موجک های پایه مختلف تشکیل گردیده و با اعمال ویژگی های آماری (میانگین و واریانس) ضرایب تبدیل موجک دو بعدی گسسته بر مبنای تک تک اعضا بانک، به یک طبقه بند شبکه عصبی، کارایی هرکدام از موجک های پایه در دستیابی به یک نرخ بازشناسی مطلوب بررسی گردیده و نهایتاً خانواده موجک پایه دابیچز برای بازشناسی کلمات دست نویس فارسی مناسب تر از سایر موجک های پایه تشخیص داده شده است. بنابراین بانکی از خانواده موجک پایه دابیچز (db1 تا db10) تشکیل گردیده، سپس تبدیل موجک دو بعدی گسسته تا چهار مرحله بر مبنای تک تک اعضا این خانواده، بر تمامی تصاویر نمونه اعمال شده است. آنگاه از تمامی ضرایب موجک نماینده کلیات فرکانس پایین و جزئیات فرکانس بالا در مرحله چهارم تبدیل، ویژگی های آماری میانگین و واریانس استخراج شده و این ویژگی ها به همراه ضرایب ساختاری حاصل از اعمال الگوریتم تجزیه تحلیل تطابقی ca، در یک بردار ویژگی برای هر تصویر نمونه ذخیره می گردد. در مرحله بعد، پیش از اجرای عملیات طبقه بندی از الگوریتمfcnn برای انتخاب مثال های موثر در آموزش استفاده شده و نهایتاً ماتریس حاصل از اجرای این الگوریتم به عنوان ماتریس آموزش و مابقی داده ها به عنوان ماتریس آزمون برای بازشناسی به طبقه بند mlp ارسال می شود. پس از آن، یک مرحله اعمال الگوریتم بهینه سازی uta برای حذف ویژگی های غیر موثر و مخرب به منظور کاهش ابعاد بردارهای ویژگی، افزایش بازدهی شبکه، بهبود دقت و سرعت بازشناسی اجرا می گردد. بعنوان مزیت این شیوه پیشنهادی، می توان به توانمندی ویژگی های آماری مرتبط با ضرایب موجک دوبعدی گسسته مبتنی بر موجک های پایه خانواده دابیچز، در کنار ضرایب الگوریتم تجزیه تحلیل تطابقی ca به منظور تولید ویژگی های دقیق و موثر برای توصیف کلمات دست نویس فارسی اشاره نمود. همچنین افزایش دقت طبقه بندی با اعمال الگوریتم fcnn و دستیابی به ابعاد بهینه و سرعت مطلوب سیستم بازشناسی با اجرای الگوریتم uta، از دیگر مزایای این روش هستند. اعتبار اجرای شیوه ی پیشنهادی بر روی بخشی از پایگاه داده ایرانشهر(متشکل از 640 تصویر کلمه دست نویس)، با دقت طبقه بندی 99.33% به اثبات رسیده است.

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

طبقه بندی تراکم توده های جنگلی با استفاده از تصویر ماهوارۀ IRS و الگوریتم ناپارامتریک kNN

برآوردهای کمّی و دقیق از مشخصه‌های توده‌های جنگلی لازمه مدیریت صحیح آنها است. تصاویر سنجش از دور با توجه به اطلاعات مکانی دقیق و وسیع، همواره ابزاری مقرون به صرفه در مدیریت جنگل است و یکی از متداول‌ترین کاربردهای تصاویر در علم جنگلداری، طبقه‌بندی مشخصه‌های توده‌های جنگلی و تهیۀ نقشه‌های موضوعی آنها است. هدف این پژوهش بهینه‌سازی طبقه‌بندی تراکم (تعداد درختان در هکتار) در توده‌های جنگلی با استفاده...

متن کامل

بازشناسی کلمات دست نویس فارسی بر اساس جداسازی بخش ها

در این تحقیق یک سیستم بازشناسی کلمات فارسی معرفی می شود که از خودهمبستگی محلی مرتبه بالای تصویر قطبی-لگاریتمی برای استخراج ویژگی از زیر- کلمات فارسی استفاده می کند. این شیوه ی استخراج ویژگی باعث می شود سیستم در مقابل تغییرات نگارشی مانند تغییر مقیاس های خطی و چرخش مقاوم شود. از مراحل مهم در یک سیتم بازشناسی کلمات، مرحله استخراج ویژگی می باشد. با توجه به این که کلمات دست نوشته دارای تغییرات نگار...

15 صفحه اول

بازشناسی کلمات دست نوشته با ویژگی های نوین و کاهش فرهنگ لغت

بازشناسی کلمات دست‌نوشته و تبدیل آن به متن تایپی معادل می‌ تواند در تفسیر دست‌نوشته و جستجو در اسناد بسیار حائز اهمیت باشد. در این مقاله سیستمی به منظور تشخیص برون‌ خط دست‌ نوشته فارسی در یک فرهنگ لغت محدود معرفی شده است. به منظور استخراج ویژگی، بعد از بلوک ‌بندی تصویر ورودی و استخراج مرکز هر بلوک توسط مرکز ثقل، میانگین مرکز اجزای متصل از الگوریتم سیفت متراکم استفاده شده است. از روش آنالیز تفکی...

متن کامل

بهبود نرخ بازشناسی ارقام دست نویس فارسی با استفاده از روش های ادغام در سطح ویژگی

هدف یک سیستم بازشناسی الگو، قرار دادن الگوها با کمترین خطا، در کلاس مربوط به خودشان است. بازشناسی ارقام دستنویس فارسی یکی از مسائل مهم در حوزه بازشناسی الگو می باشد. تحقیقات در این زمینه چندین دهه است که آغاز شده است و هنوز هم در حال تحول می باشد. در سیستم های اولیه بازشناسی الگو از یک ویژگی و یک طبقه بند استفاده می شد. این سیستمها برای بازشناسی الگوهای پیچیده و کاربردهای زمان حقیقی مشکل داشتند...

15 صفحه اول

ارائه خصیصه های خاص زبان فارسی جهت بازیابی و بازشناسی کلمات تصویری فارسی با استفاده از تعبیه برچسب

جستجو و بازیابی کلمات دستنویس در اسناد تصویری روشی جایگزین برای بازشناسی کاراکترهای نوری (OCR) است. این راهکار بیشتر در مواردی که بازشناسی کاراکترهای نوری دقت پایینی دارند، مانند متون دستنویس یا متون چاپی با کیفیت پایینی مطرح می‌گردد. امروزه یکی از روشهای کارآمد در بازیابی مبتنی بر محتوای تصویر، که برای کلمات تصویری هم توسعه داده شده است، استفاده از رده‌ بندی مبتنی بر خصیصه (Attribute-based Cla...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

نوع سند: پایان نامه

دانشگاه آزاد اسلامی - دانشگاه آزاد اسلامی واحد تهران مرکزی - دانشکده مهندسی برق و الکترونیک

کلمات کلیدی

نمایه ها:

میزبانی شده توسط پلتفرم ابری doprax.com